语言学习与人工智能
语音丨吴伯凡
所谓智能
就是面对一个陌生的
全新的场景时
能够给出解决方案
—
注:以下内容,根据吴老师录音整理而成。
有个朋友曾给我出过一道题,让我以最简单的方式跟他讲讲人工智能和传统电脑的区别。区别当然很大,但是如何以最简单的方式来阐述,还是有一些难度。我思考了一会儿,跟他说:“打个比方来说,两者有点像小孩学习语言和成年人学习第二语言的差别。”
两种语言学习方式有何不同?我们先来看效果。
一般而言,一岁半左右的小孩就已经初步掌握了自己的母语基础,尽管那时候他的智力尚未完全开化。有些小女孩在一岁多的时候就特别能说会道,三岁以后,经常会蹦出很多让大人惊诧不已的问题,甚至可以和成年人开展语言游戏。
相较之下,成年人学一门外语要多久?每个人都可以回顾一下,自己学习英语有多久了,绝大多数人学习英语的时间估计都超过十年了,但是又有多少人敢说自己真的掌握了这门外语呢?
所以,两种语言学习方式在效果上差异巨大,而且小孩学习语言的方式完胜。如此巨大的效果差异,自然与两种语言学习的方式密不可分。
小孩出生不久,父母或者爷爷奶奶就会抱着他说话,尽管大家都知道他们完全听不懂,但是这无形中给孩子提供了一个良好的语言输入环境,他们便在这种似懂非懂的情况下开始了语言学习 。
而成年人是如何学习第二语言的呢?以英语为例,我们首先会学习这门语言的规则,也就是语法。我们会花很大的功夫去搞清楚什么是主语、什么是谓语,主语和谓语之间的位置是怎样的,代词的主格和宾格有什么变化规律,动词的时态该如何使用……
成年人在学习一门语言时,是既要知其然,也要知其所以然。但是小孩子学习语言,压根就不问什么“所以然”的问题。结合我儿子小时候学习语言的一些有趣经历,可以对这个问题进行更为生动的阐述。
记得他刚学会说话不久,突然问我:“爸爸,什么叫‘糟糕’?”我很难用他能够理解的语言给他解释这个词,所以迟疑了一会。接着,他又问道“‘糟糕’是不是就是忘记东西的意思?”听完他的问题,我先是愣了一下,仔细想想之后才恍然大悟。我在忘拿某件东西后,经常会说“糟糕”,因为他反复看到这种对应场景,自然会根据场景去猜测词语的含义。
通过场景猜测词语含义的现象,在小孩学习语言的时候很常见。
有一次,我听见儿子对家里保姆说道:“姐姐,你怎么这么不听话!”细究原委后得知,原来是他要干一件事,保姆不让他干,他就突然蹦出这么一句话。在成年人看来,他的这句话显然用错了场景,因为只有大人能说小孩不听话,小孩怎么能说大人不听话呢?
之所以他会说出这样的话,也源于一些场景。在此之前,很可能他经历了很多次,自己特别想干一件事情,但是大人出于他的安全和健康的考虑,都会违背他的意志,阻止他,当他强行要干这件事的时候,大人就会说:“你怎么这么不听话?”这样,他就将这句话和这样一个场景联系在了一起。
最初,他们对于一个词语的理解可能完全源于想当然,这种想当然很可能是错误的,但是随着他观察和经历的场景越来越多,他会主动调整自己对这个词的认知,逐渐明白这个词的真实含义,到最后能够准确的使用。
记得有一次我儿子在玩乐高玩具,他花了很长时间搭积木,最后拼成了一个作品,随即,他说道:“我成功了”。我觉得很有意思,就问他:“你还会说‘成功’,你知道它是什么意思吗?”听了我的问题,他有点懵,因为他没办法解释“成功”的含义。但是很快,他又冒出来一句“Good job”,这一句突如其来的英语让我又惊又喜。
很快,我也知道了其中的缘由。因为那阵子他正在玩一个电脑游戏,当他打中一架飞机后,电脑就会反馈一句“Good job”。一旦场景再现,他就会形成一种习惯性的反应模式。
从这些经历可以看出,小孩学习的任何一句话都连带着一个场景和一种模式识别。当他用乐高积木搭出一个东西的时候,这个场景和他打电脑游戏的场景有某种想通之处,他也能够识别二者的相似性和相通性,所以,他就用“Good Job”来形容成功。
小孩学习语言的方式其实就是刻意练习,他不知道背后的原理,只是在不同的场景中摸索和试错,在众多的场景当中悄悄的累积形成一种模式识别。
《新概念英语》大家都不陌生,这套教材的编撰人亚历山大在书籍的开篇序言中写过一句话:“学会使用一门语言和了解这门语言完全是两码事。”
通过对比两种不同的语言学习方式,能够帮助我们理解人工智能和传统电脑之间的差别。
人工智能在早期分为两个阵营,一个阵营是基于规则的符号型人工智能。就是提前预设很多的规则,当一个明确的问题出现以后,根据这套规则会计算出一个答案,相当于一台应答机。
如果你提的问题在它的答案库里无法找到,它就无法回答。可想而知,这种人工智能的效用特别有限,因为我们生活的场景始终在变化。与此同时,尽管场景在变,很多变化中却又存在一些相通的东西 。
什么叫智能,就是面对一个陌生的、全新的场景时,能够给出解决方案。就这一点来看,基于规则的符号型人工智能无法应对复杂世界的各种问题。
人工智能的第二个阵营,是建立模式识别的统计系统。像一个三四岁的小孩一样,它能够通过对各种场景的熟悉,渐渐感受到众多场景中的那些相通之处。
一个三四岁的小孩能够轻易的分辨猫和狗,是因为他们事先见过很多的猫和狗,这些场景印象会在他们的大脑中累积形成一个数据库,基于这种无意中积累起的数据,小孩会形成属于他们自己的模式识别系统,当他再次面对新的场景和对象时,就会自然而然地给出反应,尽管新的场景和对象跟他已有的认知对象会有差异,但是他能够发现其中的共同点。
同样的任务,对基于规则的符号型人工智能将是巨大的难题, 尤其是在面对体型相差不大的猫和狗时,会彻底难倒它。但是对于建立模式识别的统计系统的人工智能,则不然。
今天,人工智能之所以能够迎来突飞猛进的发展,就是因为它是沿着第二条路径——基于建立模式识别的统计系统——通过大量的数据喂养,自下而上的建立了一套套模式识别,这些模式识别又会在新的场景中不断被修正,这就是我们常说的机器学习。
读到这里,我们应该清楚了电脑和人工智能的差别。像小孩学习语言一样,有效的人工智能技术是一种非灌输性、非监督性的学习,所以效率高,效果好。而成年人学习外语,之所以效率低、效果差,就在于选择的方式大有问题。
不论是人工智能技术,还是语言学习,自上而下的规则只会限制前进的脚步。快速迭代,不断试错,是持续成长的前提,也是走向成功最为有效的法门。
推荐阅读: